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提要 根据 结构 语言 学 的 音 位 对 立 理论 和 以 各 种 语言 语料库 为 基础 ， 进 行 了 一 系列 的 理论 研究 和 数 

据 分 析 ， 提 出 了 音 位 结构 功能 负担 的 计算 方法 。 计 算 步骤 主要 包括 : D 音节 对 立 频 次 统计 ; 2) 对 

立 类 型 负担 量 计算 ; 3) 音 位 系统 的 负担 量 计算 ; 4) 音 位 的 平均 负担 量 计 算 。 利 用 本 方法 ， 以 汉语 

20 个 方言 3000 音节 为 研究 对 象 ， 计 算 了 对 立 类 型 负担 量 、 音 位 系统 负担 量 和 音 位 的 平均 负担 量 在 

方言 上 的 分 布 ， 并 提出 了 音 位 负担 量 计算 的 基本 理论 。 本 方法 可 应 用 于 语言 音 位 功能 研究 、 语 言 历 
音 变 和 演化 研究 以 及 语音 工程 的 应 用 研究 。 

关键 词 音 位 功能 负担 音 位 负担 音 位 结构 


= 引言 

音 位 (phoneme) 是 结构 主义 音 位 学 (phonemics) 的 一 个 概念 ， 是 指 语言 中 区 别 意义 的 
最 小 语音 单位 。 建 立 一 种 语言 的 音 位 系统 ， 主 要 基于 对 立 原则 、 互 补 原 则 、 相 似 性 原则 、 经 
济 性 原则 等 等 〈 布 龙 菲 尔 德 1980， 萨 皮尔 1985， 布 洛 灰 、 特 雷 杰 1965)。 结 构 主 义 的 音 位 
学 在 语言 的 基本 描写 和 演化 的 研究 方面 起 了 重要 的 作用 ， 是 现代 语言 学 的 基础 。 然 而 ， 由 于 
不 同 语言 音 位 系统 的 性 质 的 差异 , 结构 主义 的 音 位 学 在 音 位 功能 的 解释 方面 显然 存在 许多 不 
足 的 地 方 。 例 如 ， 汉 藏 语系 语言 主要 是 单 音节 结构 ， 由 声韵 调 组 成 ， 而 印 欧 语系 语言 主要 是 
多 音节 结构 ， 由 音素 构成 。 另 外 ， 一 种 语言 中 有 的 音 位 只 出 现在 极 个 别 词 中 ， 而 且 系统 性 很 
差 。 由 此 看 出 ， 结 构 主义 音 位 的 定义 对 音 位 在 一 个 语言 中 的 频 度 和 功能 都 无 法 很 好 的 解释 。 
这 直接 导致 了 利用 目前 的 音 位 学 理论 很 难 解 释 许 多 语言 信息 传递 的 问题 \ 语 言 演 化 的 问题 和 
语言 类 型 的 问题 。 另 外 ， 在 音 位 的 描写 和 分 类 方面 ， 有 些 学 者 从 生理 发 音 的 角度 来 描写 ， 有 
些 学 者 注重 声学 的 作用 ， 用 声学 区 别 性 特征 来 描写 ， 还 有 些 学 者 强调 心理 的 功能 ， 利 用 感知 
结果 来 描写 。 因 此 , 在 音 位 学 研究 中 存在 种 种 不 同 的 观点 和 争论 。 为 此 赵 元 任 先 生 专门 讨论 
“ 音 位 标 音 法 的 多 能 性 ”( 赵 元 任 1934/1985) 来 协调 不 同 的 争论 。 

音 位 学 理论 上 的 这 些 问题 实际 上 一 直 受 到 语言 学 家 的 关注 ， 其 中 音 位 功能 负担 
(functional load) 的 研究 就 是 试图 解决 这 些 问题 的 一 个 方面 。 音 位 负担 量 的 概念 和 研究 可 以 
追溯 到 早期 的 布拉格 学 派 时 期 (Mathesius 1929, Jakobson 1931, Trubetzkoy 1939)， 当 时 主 
要 注重 于 音 位 学 的 二 元 对 立 。 在 功能 负担 的 语言 学 研究 方面 , 50 FR, 主要 有 霍 凯特 (Hockett 
1955, 1967) 和 格林 博 格 (Greenberg 1959) 的 研究 。 霍 凯特 认为 : 功能 负担 的 重要 性 在 于 
它 对 描写 音韵 系统 有 重要 的 价值 ， 从 而 使 我 们 可 以 有 一 个 尺度 来 认识 语言 信息 、 语言 多 余 度 
和 言语 识别 。 格林 博 格 认为 : 功能 负担 以 通用 的 方式 反映 了 一 组 音 位 或 一 组 对 立 特征 各 成 员 
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之 间 对 有 区 别 意 义 信 号 的 贡献 。 在 60 年 代 ， 主 要 有 赫 厄 希 斯 瓦尔 德 (Hoenigswald 1960) X 
于 功能 负担 和 音 变 的 研究 , 他 认为 : 功能 负担 和 语言 的 音 变 有 关 , 并 提出 了 一 个 假说 , 即 “ 在 
一 种 语言 里 ， 如 果 一 种 对 立 用 的 很 少 ， 它 的 消失 对 系统 造成 的 危害 要 小 于 功能 负担 大 的 对 
立 ”60 年 代 还 有 王 士 元 教授 (Wang 1967) 有 关 功 能 负担 的 著名 研究 和 京 * 罗 伯 特 (King 1965, 
1967a, 1967b) 的 研究 。 王 士 元 教授 首次 实现 了 功能 负担 的 计算 ， 指 出 了 计量 功能 负担 的 困 
难 ， 并 给 出 了 解决 这 些 困难 的 方法 。 他 讨论 了 音 位 系统 中 常见 的 三 种 分 布 、 霍 山特 与 格林 博 
格 的 测量 方法 以 及 这 些 方法 和 香农 等 (Shannon and Weaver 1949; Shannon 1951; Kucera 1963) 
的 通信 理论 及 各 种 语言 学 概念 的 关系 ,系统 地 发 展 了 四 种 计量 功能 负担 的 方法 。 王 士 元 教授 
的 研究 为 后 来 功能 负担 的 研究 建立 了 一 个 理论 上 的 基本 框架 。 另 外 ， 王 士 元 教授 还 指出 “如 
果 功 能 负担 在 音 变 中 确实 起 作用 的 话 , 那么 用 量化 的 解释 至 少 可 以 从 一 个 方面 曾 明 音 变 这 
难题 ”。 京 。 罗伯特 将 音 变 和 功能 负担 一 同 进行 研究 ， 并 着 重 研究 了 音 位 功能 和 语音 音 变 的 
关系 。 在 本 世纪 初 有 苏 仁 德 兰 和 尼 育 基 (Surendran and Niyogi 2003)、 苏 仁 德 兰 和 利 佛 
(Surendran and Levow 2004) 的 研究 , 苏 仁 德 兰 和 利 佛 在 其 研究 中 不 仅 讨 论 了 霍 凯 特 的 定义 ， 
还 讨论 了 音 位 、 区 别 性 特征 和 超 音 段 特征 的 功能 负担 ， 同 时 ， 他 们 还 研究 了 汉语 声调 的 功能 
负担 ， 发 现 汉 语 声调 的 功能 负担 与 元 音 同 样 高 。 

音 位 功能 负担 的 研究 促进 了 语言 功能 的 研究 , 同时 也 促进 了 计算 语言 学 和 语音 技术 的 发 
展 。 例 如 ， 目 前 语音 识别 和 合成 中 常用 的 双 音 子 〈diphone) 和 三 音 子 (triphone) 就 来 源 于 
音 位 功能 负担 的 理论 。 从 以 往 的 研究 看 ， 功 能 负担 研究 都 是 在 大 文本 的 基础 上 进行 音 位 的 功 
能 负担 统计 和 量化 以 及 计算 该 语言 的 炉 值 和 克 余 度 。 众 所 周知 ,世界 上 大 部 分 语言 是 没有 文 
字 和 文献 的 ， 这 就 大 大 限制 了 这 一 理论 方法 在 语言 学 研究 中 的 应 用 和 发 展 。 因 此 发 展 出 一 种 
只 利用 基本 语素 和 词汇 就 能 对 语言 的 音 位 功能 进行 计算 和 量化 研究 的 方法 就 显得 十 分 迫切 。 
根据 结构 语言 学 的 音 位 对 立 理论 和 基于 我 们 建设 的 汉语 普通 话 、 汉 语 方言 、 藏 语 方言 、 藏 缅 
语 等 语料库 , 我们 进行 了 一 系列 的 理论 研究 和 数据 分 析 ， 最 终 提出 了 音 位 结构 功能 负担 的 计 
算 方法 。 这 种 音 位 内 部 的 “结构 功能 负担 量 ” 是 封闭 性 的 。 从 性 质 上 看 ， 结 构 功 能 负担 更 能 
体现 一 个 语言 音 位 系统 的 性 质 。 因 为 只 需要 语言 的 基本 语素 便 可 进行 研究 ,所 以 能 应 用 于 任 
何 一 种 语言 的 音 位 功能 研究 、 语言 历史 音 变 和 演化 研究 以 及 语音 合成 和 识别 的 研究 ， 并 希望 
能 建立 和 形成 一 种 新 的 音 位 功能 研究 的 理论 框架 。 本 文 以 汉语 方言 为 例 重点 介绍 音 位 结构 功 
能 负担 的 具体 计算 方法 。 
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音 位 负担 的 定义 和 类 型 
在 音 位 负担 的 定义 上 ， 我 们 将 两 个 单 音节 语素 之 间 的 区 分 定义 为 语言 的 一 个 负担 量 单 
位 ， 由 一 个 或 多 个 不 同 的 音 位 来 负担 。 通常 大 多 数 语言 用 音素 音 位 描写 , 但 中 国 汉 藏 语系 语 
言 在 音 位 结构 上 有 声母 、 韵 母 和 声调 这 一 层级 的 音 位 ， 音 位 单位 可 以 是 音素 音 位 或 声韵 调 音 
位 。 为 了 能 更 好 地 解释 音 位 负担 量 的 计算 方法 和 汉 藏 语系 语言 的 音 位 负担 ， 我 们 选用 声 、 韵 
和 调 作为 音 位 负担 量 的 计算 单位 。 如果 由 一 个 音 位 单位 来 区 别 这 两 个 语素 ， 该 单位 就 承载 这 
个 语素 的 音 位 负担 量 ; 如 果 是 由 多 个 音 位 单位 来 区 别 这 两 个 语素 ,， 音 位 负担 量 由 多 个 音 位 共 
同 承担 。 

1.1 定义 

一 种 语言 音 位 系统 内 部 音 位 结构 、 音 位 分 布 和 音 位 功能 的 负担 ， 称 为 “ 音 位 结构 功能 负 
JH” (phoneme structural functional load)， 简 称 “ 音 位 负担 ”(phoneme load)。 对 音 位 结构 功 
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能 负担 的 相关 万 


位 分 布 和 音 位 功能 负担 为 


完 称 为 “ 音 位 负担 研究 ” 主要 是 以 一 种 语言 基本 语素 的 内 部 音 位 结构 、 音 
究 对 象 。“ 言 语 功能 负担 研究 ”(functional load) 是 以 一 种 语言 的 


实际 文本 为 基础 的 音 位 功能 负担 研究 ， 两 者 有 本 质 的 区 分 
为 了 能 对 计算 方法 进行 清楚 地 说 明 , 我 们 根据 汉 藏 语系 语言 单 音节 的 特点 ,提出 了 一 些 


新 的 概念 并 进行 详细 解释 。 


语素 :本 文 是 指 单 音节 语素 。 


对 立 和 声调 对 立 以 及 这 些 对 立 的 组 合 。 


语言 负担 量 单位 : 
音节 负担 量 : 在 一 个 封闭 的 音 位 系统 和 
担 量 的 总 和 ， 即 该 音节 同音 字 的 数量 。 


1.2 类 型 


音节 对 立 : 是 指 不 同 单 音节 语素 的 对 并 ,可 体现 为 某 两 个 单 音 节 语 素 的 声母 对 立 、 韵 母 


个 单 音节 语素 承载 1 个 语言 负担 量 单位 。 


基本 语素 系统 内 , 一 个 音节 的 负担 量 为 该 音节 负 


在 汉 藏 语系 语言 中 ， 基 本 语素 大 多 是 单 音 节 ， 每 个 音节 均 由 声母 和 韵母 或 声母 、 韵 母 和 


声调 组 成 。 音 节 和 音节 之 间 产 生 4 种 对 立 类 型 、8 种 对 立方 式 ， 其 中 包括 : 1 种 三 项 对 立 、3 
种 两 项 对 立 、3 种 单项 对 立 和 1 种 无 对 立 ， 形 成 了 音 位 系统 结构 和 分 布 的 基本 形式 和 框架 ， 


见 表 1。 
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对 立 对 立方 式 
类 型 
三 项 对 并 声 / 韵 / 调 对 立 
两 项 对 并 声 / 竟 对 立 、 声 / 调 对 立 、 韵 / 调 对 立 
FATS AE ERI WAIL, EV 


无 对 立 声 / 韵 / 调 相同 


我 们 以 北京 话 为 例 来 解释 这 8 种 对 立方 式 。 三 项 对 立 是 指 两 个 单 音节 语素 之 间 声 韵 调 都 
不 同 ， 如 : 八 pa55、 笛 ti35。 两 项 对 立 是 指 两 个 单 音节 语素 之 间 只 有 两 个 音 位 单位 不 同 ， 即 
FIAT, GH: 八 pa55， 低 ti55 或 声 / 调 不 同 ， 如 : 八 pa55， 大 ta51; 或 韵 / 调 不 同 ， 如 : 
八 pa55， 不 bu51。 单 项 对 立 是 指 两 个 单 音节 语素 之 间 只 有 一 个 音 位 单位 不 同 ， 即 声母 不 同 ， 


如 : 八 pa55， 拱 ta55; BRERA TA], H 


H: 八 pa55， 波 bo55; 或 声调 不 同 ， 如 : 八 pa55， 拔 


pa35。 无 对 立 是 指 两 个 单 音节 语素 之 间 没 有 音 位 单位 不 同 , 即 同 音 词 , 如 : 八 pa55, E pads. 
根据 以 上 的 基本 定义 ， 我 们 在 下 一 节 讨 论 音 位 负担 的 计算 方法 和 整个 语言 学 框架 。 


al 


计算 方法 


对 江 类 型 负担 昌 


att & 
担 量 计算 的 基础 
2.1 音节 对 立 频次 计算 


计算 每 一 个 语 


lio 


下 面 以 汉语 方 音字 汇 3000 字 北 京 话 为 例 ; 


为 语素 “ 巴 (pa55)” 对 立 频次 计算 图 。 


首位 的 结构 负担 计算 要 靠 音节 和 音节 之 间 的 对 立 关 系 来 体现 , 包括 : 音节 对 立 频 次 统计 、 
和 音 位 负担 计算 。 音 节 对 立 频 次 的 统计 是 对 立 类 型 负担 量 计算 和 音 位 负 


素 对 应 的 音节 与 其 他 所 有 语素 对 应 的 音节 之 间 的 对 立 关 系 ， 即 对 立 频 次 。 


行 说 明 ， 计 算 每 一 个 语素 的 音节 对 立 情况 ,图 1 
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北京 话 “ 
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同音 节 ，2 次 无 对 立 形 成 “ 巴 ” 的 同音 字 ， 
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产生 2999 次 对 立 关 系 ， 其 中 
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(1) 三 项 对 立 : 声 / 韵 / 调 对 立 2120 次 ， 与 “ 巴 ” 声 母 、 韵 母 和 声调 都 不 相同 的 语素 共 
有 2120 个 。 

(2) 两 项 对 立 : 声 / 韵 对 立 680 次 ， 即 与 “ 巴 ” 声 母 、 韵 母 不 同 而 声调 相同 的 语素 共有 
680 个 ; 声 / 调 对 立 42 次 ， 即 与 “ 巴 ” 声 母 、 声 调 不 同 而 韵母 相同 的 语素 共有 42 +; Be 
对 立 98 次 ， 即 与 “ 巴 ” 韵 母 、 声 调 不 同 而 声母 相同 的 语素 共有 98 个 。 

(3) 单项 对 立 : 声母 对 立 17 次 ， 即 与 “ 巴 ” 声 母 不 同 而 韵母 和 声调 相同 的 语素 共有 
17 个 ; 韵母 对 立 33 次 ， 即 与 “ 巴 ” 韵 母 不 同 而 声母 和 声调 相同 的 音节 共有 33 个 ; 声调 对 
立 7 次 ， 即 与 “ 巴 ” 声 调 不 同 而 声母 和 韵母 相同 的 音节 共 7 个 。 

Skee ae iH ae 用 同样 的 方法 计算 第 2 个 音节 ,第 3 个 音节 ， 以 此 类 推 ， 
直到 全 部 3000 音节 计算 完毕 , 得 到 音节 对 立 频 次 表 。 表 2 为 北京 话 3000 字汇 的 音节 对 立 频 
次 表 。 

表 2 北京 话音 节 对 立 频 次 表 
序号 | 字 目 | 音节 SO MANY || 无 对 立 
声 / 韵 / 调 | 声 / 韵 | 声 / 调 | 韵 / 调 | 声母 | 韵母 | 声调 
1 | E | pa55 2120 680 42 98 17 33 7 3 
2 | Æ | pa55 2120 680 42 98 17 33 7 3 
3 | A | pa55 2120 680 42 98 17 33 7 3 
4 | tk | pa35 2112 688 41 121 18 10 9 1 
5 | 把 na| pa214 | 2320 480 52 103 7 28 9 1 
3000) 用 | iun51 1714 909 9 236 0 124 7 1 
合计 6024398 | 2151884 | 226456 | 337300 | 82166 | 137952 | 25056| 14788 
平均 2008.1 717.3 | 75.5 | 112.4 | 27.4 | 46 8.4 | 4.9 

2.2 对 立 类 型 负担 量 计 香 

对 立 类 型 的 负担 量 计算 包括 三 项 对 立 、 两 项 对 立 和 单项 对 立 类 型 的 计算 ， 其 大 小 表示 一 
种 语言 音节 之 间 的 关系 及 音 位 组 合 结构 方式 。 计 算 过 程 为 : (1) 以 音节 为 计算 单位 ， 合 并 同 
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序号 ”音节 


音字 ， 每 个 音节 的 负担 量 为 其 同音 字 个 数 TGD); (2) 由 于 同音 字 对 应 的 各 对 立 频次 数量 相同 ， 
乘 以 TO 系数 ， 得 到 音节 的 各 对 立 频次 ; (3) 根 据 音节 的 各 对 立 频 次 的 数量 大 小 关系 ， 计 算出 
每 一 个 音节 的 三 项 对 立 、 两 项 对 立 和 单项 对 立 分 别 承 载 的 负担 量 。 
另外 ， 封 闭 语 料 库 中 单 音节 的 总 语素 数 用 符号 N 表示 ， 代 表 整 个 语料库 的 负担 总 量 。 
(一 ) 三 项 对 立 音 位 负担 量 计算 
音节 三 项 对 立 类 型 的 负担 量 通 过 音节 三 项 对 立 频次 数量 来 计算 。 因 此 ， 第 i 个 音节 的 三 
项 对 立 负 担 量 FFL_TR(G)， 可 以 通过 公式 (1) 得 到 : 
SYD, 
NT (1) 
公式 (1) 中 ，SYD 代表 三 项 对 立 频次 。 
(二 ) 两 项 对 立 音 位 负担 量 计算 
音节 两 项 对 立 音 位 负担 量 为 三 种 两 项 对 立方 式 的 负担 量 之 和 。 因 此 ， 第 i 个 音节 的 两 项 
对 立 负担 量 FFL_DBG)， 可 以 通过 公式 (2) 得 到 : 
My + SD +YD,, 
te (2) 
公式 (2) 中 ，SY 代表 两 项 声 / 韵 对 立 频 次 ，SD 代表 两 项 声 / 调 对 立 频 次 ，YD 代表 两 项 韵 / 
调 对 立 频 次 。 
(=) 单项 对 立 音 位 负担 量 计算 
音节 单项 对 立 类 型 的 负担 量 为 三 种 单项 对 立方 式 负担 量 的 总 和 。 因 此 ， 第 i 个 音节 单项 
对 立 类 型 负担 量 FFL_SG(i)， 可 以 通过 公式 (3) 得 到 : 
FPL_SG,, =T, 0 to 
(i) (3) 
公式 (3) 中 ，S 代表 单项 声母 对 立 频次 ，Y 代表 单项 韵母 对 立 频次 , D 代表 单项 声调 对 六 
次 。 
通过 上 面 对 立 类 型 负担 量 的 计算 公式 , 可 以 得 到 不 同音 节 对 立 类 型 上 的 负担 量 以 及 不 同 
音节 在 对 立 类 型 上 的 差异 。 以 “(pa55) ”音节 为 例 , 对 应 3 个 语素 “ 巴 、 疤 、 八 ”所 以 “(pa55)” 
的 总 负担 量 为 3， 按照 对 立 的 频次 比例 关系 分 配 在 除 “ 无 对 立 ” 的 其 他 7 种 对 立 条 件 下 。 如 
表 3 所 示 。 
表 3 北京 话 对 立 类 型 负担 量 计算 表 
三 项 对 六 两 项 对 立 单项 对 立 同音 字 ”负担 量 


FFL_TR,y=Tyy* 


FFL _ DB, =T 


= 


1 pad5 2.122 0.681 0.042 0.098 0.017 0.033 0.007 EL, JB, /\ 3 
2 pa35 0.704 0.229 0.014 0.04 0.006 0.003 0.003 tk 1 


3 pa2l4 0.774 0.16 0.017 0.034 0.002 0.009 0.003 把 ( 握 ) 1 
1036 iuņ51 0.572 0.303 0.003 0.079 0 0.041 0.002 用 1 
平均 值 1.941 0.694 0.073 0.109 0.027 0.045 0.008 

最 大 值 10.568 5.233 0.96 1.282 0.459 0.615 0.157 

最 小 值 0.56 0.139 0 0.008 0 0.0003 0 

合计 2011.28 718.49 75.68 112.61 27.45 46.06 8.37 3000 


2.3 音 位 负担 量 计算 

语言 系统 中 , 每 个 音节 的 地 位 是 靠 声母 、 韵 母 和 声调 3 个 对 立 单元 产生 的 8 种 对 立 关 系 
来 体现 。 音 节 同 音字 越 多 ,该 音节 承载 的 音 位 负担 量 越 大 ， 在 语言 系统 中 的 地 位 越 高 ， 所 分 
配 到 声母 、 韵 母 和 声调 的 音 位 负担 量 就 越 大 。 

(一 ) 声母 负担 量 计算 

在 声 / 韵 / 调 三 项 对 立 分 布 中 , 声母 承担 总 负担 量 的 1/3, 在 声 / 韵 和 声 / 调 两 项 对 立 分 布 中 ， 
声母 均 承 担 总 负担 量 的 1/2， 而 在 声母 单项 对 立 中 ， 声 母 承担 所 有 负担 量 。 因 此 ， 可 通过 公 
式 (4) 对 声母 负担 量 FFL_S(i) 来 进行 计算 : 
SYD /3+ SY) 12+ SD, /2+ 50, 


NTa (4) 


然后 把 相同 声母 的 负担 量 相 加 ， 得 到 某 个 声母 的 负担 量 FFL_S, PRENER KME 
节 个 数 。 见 公式 (5): 


FFL_S p =T,* 


(© 


; 
FFL_S =)'( FFL_S,) 


= (5) 
某 个 声母 负担 量 FFL_S 除 以 P 得 到 其 平均 负担 量 FFL_S_AV， 见 公式 (6): 
P 
> (FFL_ Be 
FFL_S_AV= 刁 
P (6) 


其 他 声母 也 用 同样 的 方法 进行 计算 ， 得 到 每 一 个 声母 的 负担 量 ， 所 有 声母 负担 量 的 总 和 
即 为 声母 总 负担 量 。 

(二 ) 韵母 负担 量 计算 

在 声 / 韵 / 调 三 项 对 立 分 布 中 , 韵母 承担 总 负担 量 的 1/3, 在 声 / 竟 和 韵 / 调 两 项 对 立 分 布 中 ， 
韵母 均 承 担 总 负担 量 的 1/2， 而 在 韵母 单项 对 立 中 ， 韵 母 承担 所 有 负担 量 。 因 此 ， 在 对 韵母 
负担 量 FFL_YG) 计 算 ， 可 通过 公式 (7) 来 进行 计算 : 
p SYD 13+ SY (24+ Diy 124 Xi 


和 一 To (7) 


然后 把 相同 韵母 的 负担 量 相 加 ,得 到 某 个 韵母 的 负担 量 FFL_Y, P 为 某 个 韵母 出 现 的 音 
节 个 数 ， 见 公式 (8): 


FFL_Y, = 


= 


r 
FFL_Y =) (FFL_Yọ) m 


某 个 韵母 负担 量 FFL_Y 除 以 P 得 到 其 平均 负担 量 FFL_Y_AV， 见 公式 (9): 


> (FFL Y) 
a 


FFL_Y _AV = 总 -一 一 
(9) 


其 他 韵母 也 用 同样 的 方法 进行 计算 , PEE EI ILL, PATA BE TA 
即 为 前 母 总 负担 量 。 

(三 ) 声调 负担 量 计算 

在 声 / 韵 / 调 三 项 对 立 分 布 中 ， 声 调 承担 总 负担 量 的 13， 在 声 /调和 前 / 调 两 项 对 立 中 ， 声 


inj 
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调 均 承担 总 负担 量 的 112， 而 在 声调 单项 对 立 中 ， 声 调 承担 所 有 负担 量 。 因 此 ， 对 声调 负担 
量 FFL_DG) 计 算 ， 可 通过 公式 (10) 来 进行 计算 : 
SYD) /3+SD 12+ YD, 12+ D, 


N (10) 


然后 把 相同 声调 的 负担 量 相 加 ， 得 到 某 个 声调 的 负担 量 FFL_D, P 为 某 个 声调 出 现 的 音 
节 个 数 ， 见 公式 (11): 


fin 


FFL_D, 


a = To 


g 
FFL_D=} (FFL_D,) 
可 (11) 
声调 负担 量 FFL_D 除 以 P 得 到 某 个 声调 的 平均 负担 量 FFL_D_AV， 见 公式 (12): 


p (12) 

其 他 声调 也 用 同样 的 方法 进行 计算 ， 得 到 每 一 个 声调 的 负担 量 ， 所 有 声调 负担 量 的 总 和 
即 为 声调 总 负担 量 。 
2 “汉语 方言 音 位 结构 负担 计算 

根据 上 一 节 音 位 负担 的 算法 ， 我 们 对 汉语 20 个 方言 的 音 位 结构 负担 进行 了 计算 。 本 文 
利用 该 结果 来 说 明 音 位 负担 的 语言 学 意义 。 步 又 为 : (1) 对 音节 的 对 立 频次 进行 统计 计算 ， 
分 别 得 到 每 个 音节 在 不 同 对 立 类 型 中 的 各 自 对 立 频 次 ，(2) 对 对 立 类 型 进行 负担 量 计算 ， 计 
算 每 种 对 立 类 型 下 所 包含 的 对 立方 式 所 承担 的 负担 量 , 为 了 表述 方便 将 负担 量 转换 成 了 百 分 
比 ， 下 同 。 见 图 2 和 表 3; (3) 计 算出 音 位 即 声母 、 韵 母 、 声 调 承 担 的 负担 量 ， 如 图 3 所 示 ; 
(4) 用 每 一 个 方言 的 声母 负担 量 除 以 声母 数量 ， 韵 母 和 声调 也 用 同样 的 方法 ， 得 到 声母 、 痢 
母 和 声调 的 平均 负担 量 ， 如 图 4 所 示 。 

3.1 汉语 方言 音节 对 立 类 型 频次 
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图 2 不 同 对 立方 式 的 频 度 百分比 关系 图 


从 图 2 可 以 看 出 : (D) 虽 然 单项 对 立 是 语言 区 别 意义 的 根本 ， 但 是 单项 对 立 数值 很 小 ， 
汉语 方言 更 多 的 是 靠 三 项 对 立 和 两 项 对 立 来 完成 语意 的 区 别 ，(2) 对 立方 式 负担 量 有 相对 稳 
定 的 范围 ; (3) 两 项 对 立 和 三 项 对 立 为 反比 关系 。 


小 ， 为 19.49%， 其 分 布 范 


表 4 不 同 对 立方 式 的 频 度 百分比 (%) 
方言 点 | 三 项 对 立 项 对 立 | 单项 对 立 言 点 | 三 项 对 立 项 对 立 | 单项 对 立 
温州 78.38 19.49 2.13 双 峰 71.33 25.96 2.71 
广州 78.09 19.85 2.06 长 沙 71.14 25.93 2.93 
苏州 77.78 19.79 2.43 ERA 70.43 26.48 3.09 
阳江 77.23 20.66 2.11 西安 67.88 29.57 2.55 
潮州 76.98 21.05 1.97 ry 68.57 29.82 1.61 
南昌 75.84 21.88 2.28 济南 67.32 29.94 2.74 
福州 75.51 22.09 2.41 北京 67.04 30.23 2.73 
厦门 75.06 22.44 2.50 成 都 66.23 30.60 3.18 
梅县 72.92 24.57 2.50 武汉 65.99 30.73 3.28 
合肥 72.82 24.58 2.59 太原 65.63 31.04 3.33 
扬州 72. 02 25. 15 2. 83 
从 表 4 的 数据 可 以 得 出 : (1) 三 项 对 立 中 温州 话 最 大 , 为 78.38%， 太原 最 小 , 为 65.63%， 
其 分 布 范围 有 12.75 个 百分点 ， 平 均 为 72%; (2) 两 项 对 立 中 太原 最 大 ， 为 31.04%， 温 州 最 


HA 11.55 个 百分点 ， 平 均 为 25.27%; (3) 单 项 对 立 中 太原 最 大 ， 


为 3.33%， 广 韵 最 小 ， 为 1.61%， 其 分 布 范 围 只 有 1.72 个 百分点 ， 平 均 为 2.47%。 


在 音 位 学 理论 上 , 是 否 能 确定 一 个 音 位 通常 要 看 是 否 有 最 小 对 立 对 ， 即 音 位 学 的 对 立 原 
则 ， 然 而 从 汉语 方言 的 对 立 类 型 看 ， 最 小 对 立功 能 很 弱 。 因 此 用 最 小 对 立 来 描写 汉语 方言 实 
际 上 不 能 体现 出 汉语 方言 的 音 位 功能 。 音 位 学 中 第 二 项 原则 是 互补 原则 ， 从 音 位 对 立 类 型 的 
频 度 可 以 看 出 ， 两 项 对 立 和 三 项 对 立 包含 了 互补 现象 ,但 大 部 分 并 不 是 由 互补 造成 的 。 在 汉 
语 中 ge, ke, he 与 让 qi xi 实际 上 也 没有 利用 互补 原则 处 理 。 利 用 音 位 对 立 类 型 的 频 度 不 
仅 可 以 描写 音 位 的 对 立 类 型 和 分 布 ， 也 可 以 描写 音 位 功能 的 类 型 ， 为 研究 语言 的 音 位 结构 、 
音 息 功能 、 语 言 接触 和 融合 以 及 历史 演化 开辟 了 新 的 思路 和 新 的 研究 方法 。 

3.2 汉语 方言 音 位 总 负担 量 
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图 3 汉语 方言 声韵 调 总 负担 关系 图 

从 图 3 可 以 看 出 : (1) 汉 语 方言 声母 和 韵母 的 负担 量 较 大 ， 其 中 韵母 略 大 于 声母 的 负担 


里 


c= =», 


四 | 


声调 较 小 ，(C2) 汉 语 方言 声母 、 竟 母 和 声调 的 总 负担 量 各 自 


有 一 定 的 范围 


; (DE REMIR 


母 的 总 负担 量 与 声调 的 总 负担 量 为 反比 关系 , BREA EE SK, 声调 的 总 负担 


量 就 越 小 。 


RS 音 位 总 负担 量 百 分 比 〈%) 

方言 点 | 声母 负担 量 | 韵母 负担 量 | 声调 负担 量 | 方 言 点 | 声母 负担 量 | 韵母 负担 量 | 声调 负担 量 
dim) 35.15 34.90 29.95 | 合肥 | 35.64 36.75 27.61 
苏州 35.03 35.81 29.16 | 梅县 | 34.75 37.02 28.23 
阳江 34.24 36.18 29.57 | 扬州 | 35.10 37.19 27.71 
三 外 33.71 36.28 30.01 | 西安 | 36.70 37.49 25.81 
南昌 34.71 36.43 28.86 | 济南 | 36.50 37.70 25.80 
厦门 33.79 36.43 29.78 | 北京 | 36.50 37.74 25.77 
长 沙 35.43 36.45 28.12 | 成 都 | 36.45 37.79 25.75 
双 峰 36.11 36.45 27.44 | 武汉 | 36.32 37.91 25.77 
福州 33.75 36.58 29.67 | 太原 | 36.99 37.92 25.09 
济州 33.65 36.59 29.76 |) | 37.07 38.37 24.56 
ER 34.75 36.63 28.62 


™ 从 表 5 可 以 看 出 : (1) 汉 语 方言 声母 的 总 负担 量 中 ， 广 韵 最 大 ， 为 37.07%， 潮 州 最 小 ， 

= 为 33.65%。 其 分 布 的 范围 有 3.42 个 百分点 , 平均 为 35.35%; (2) 汉 语 方言 韵母 的 总 负担 量 中 ， 
PRK, 为 38.37%, 温州 最 小 , 为 34.9%。 其 分 布 的 范围 有 3.47 个 百分点 , 平均 为 36.89%; 
(3) 汉 语 方言 声调 的 总 负担 量 中 ， 广州 最 大 ， 为 30.01%， 广 韵 最 小 ， 为 24.56%。 其 分 布 的 范 
围 有 5.45 个 百分点 ， 平 均 为 27.76%。 

从 汉语 方言 声母 、 韵 母 和 声调 的 总 负担 量 来 看 ， 它 们 在 各 个 方言 中 存在 差异 。 首 先 ， 声 
母 、 韵 母 和 声调 的 总 负担 量 是 不 同 的 ， 有 的 大 ， 有 的 小 ， 反 映 出 了 音 位 结构 和 功能 的 差异 。 
其 次 ， 声母 和 韵母 的 性 质 十 分 相同 ， 总 体 上 看 ， 韵 母 的 总 负担 量 略 大 于 声母 的 总 负担 量 ， 而 
声调 的 总 负担 量 要 比 声 母 和 前 母 的 总 负担 量 小 很 多 。 第 三 ， 从 数据 上 看 ， 声 母 和 韵母 的 总 负 
担 量 大 ， 声 调 的 总 负担 量 就 小 。 这 些 数据 体现 出 ， 汉 语 方言 声 、 韵 、 调 三 者 之 间 是 一 种 动态 
n 的 和 有 机 的 关系 , 同时 也 体现 出 了 汉语 方言 音 位 结构 的 变化 。 由 于 选用 汉语 方言 的 语素 相同 ， 
要 表达 的 信息 量 也 相同 ， 但 在 长 期 的 演化 过 程 中 ， 由 于 各 种 因素 的 影响 ， 每 个 方言 的 音 位 结 
¢ 构 系 统 都 会 受到 影响 , 因此 , 音 位 负担 量 的 描写 是 一 种 对 音 位 动态 系统 和 功能 精确 的 数字 化 


= 描写 


J o 


3.3 汉语 方言 音 位 平均 负担 量 
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妈 4” 音 位 系统 的 平均 音 位 负担 量 关系 图 


从 图 4 可 以 看 出 ; (1) 汉 语 方言 声母 和 韵母 的 平均 负担 量 较 小 ， 其 中 声母 略 大 于 韵母 的 


负担 量 ， 声 调 较 大 ; (2) 汉 语 方言 声母 、 韵 母 和 声调 的 平均 负担 量 各 自 有 一 定 的 范围 ，(3) 声 
调 的 平均 负担 量 与 声母 和 韵母 的 平均 负担 量 为 反比 关系 ， 即 声调 的 平均 负担 量 越 大 ,声母 和 


韵母 的 平均 负担 量 越 就 越 小 。 
K6 音 位 平均 负担 量 百 分 比 (%) 
方言 点 | 声母 平均 | 韵母 平均 | 声调 平均 | 方言 点 | 声母 平均 | 韵母 平均 | 声调 平均 
广州 32.23 10.41 57.37 扬州 24.48 9.80 65.72 
ER 28.26 13.54 58.19 苏州 20.19 12.57 67.24 
福州 29.92 9.98 60.11 合肥 20.79 11.55 67.66 
温州 20.37 18.88 60.75 武汉 20.25 11.48 68.27 
阳江 29.72 9.32 60.96 双 峰 16.72 14.70 68.59 
厦门 28.68 9.92 61.40 成 都 19.58 11.27 69.15 
潮州 30.86 7.74 61.40 北京 18.24 10.92 70.84 
南昌 27.77 9.55 62.68 济南 16.97 11.07 71.96 
长 沙 23.80 13.23 62.97 西安 15.49 10.96 73.55 
太原 22.49 13.45 64.06 rž 12.61 3.87 83.53 
梅县 26.89 7.58 65.53 
从 表 6 可 以 看 出 : (1) 汉 语 方言 声母 的 平均 负担 量 中 ,广州 最 大 ， 为 33.23%， 广 韵 最 小 ， 
为 12.61%。 其 分 布 的 范围 有 20.62 个 百分点 ， 平 均 为 22.92%; (2) 汉 语 方言 韵母 的 平均 负担 


lin 


时 中 ， 温 州 最 大 ， 为 18.88%， 广 韵 最 小 ， 为 3.87%。 其 分 布 的 范围 有 15.01 个 百分点 ， 平 均 


为 11.38%; (3) 汉 语 方言 声调 的 平均 负担 量 中 , 广 韵 最大, 为 83.53%, 广州 最 小 , 为 57.37%。 


其 分 布 的 范围 有 21.16 个 百分点 ， 平 均 为 70.45%。 


从 汉语 方言 声母 .韵母 和 声调 的 平均 负担 量 性 质 看 , 首先 是 声调 的 平均 负担 量 数 值 较 大 ; 


内 次 是 声母 和 韵 坪 的 平均 负担 量 较 小 ， 其 中 声母 的 平均 负担 量 略 大 于 韵母 的 平均 负担 量 ; 第 


次 
是 声调 的 平均 负担 量 与 声母 和 韵母 的 平均 负担 量 成 反比 关系 。 从 整体 上 看 , 平均 负担 量 和 
负 


声调 的 平均 负担 量 反 而 没有 北京 话 的 大 ， 体 双 


互补 分 布 ， 虽 然 同 是 3000 语素 ， 实 际 声调 的 
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〖 担 量 体 现 为 相反 的 性 质 ， 即 总 负担 量 高 的 方言 ， 其 平均 负担 量 要 小 ， 而 总 负担 量 小 的 语 
平均 负担 量 反 而 要 大 。 例 如 ， 广 州 话 的 声调 数量 多 ， 总 负担 量 较 大 ， 但 平均 下 来 ， 广州 话 
| 分 析 可 以 发 现 , 广州 话 的 声调 和 声韵 母 有 大 量 


平均 负担 量 和 总 负担 量 不 同 , 总 负担 量 和 音 位 的 数量 有 关 , 平均 负担 量 不 受 音 位 数量 的 


影响 。 在 一 个 音 位 系统 中 ,平均 负担 量 表示 音 位 系统 中 每 个 音 位 的 负担 ， 音 位 的 平均 负担 量 


大 说 明 要 区 别 的 语素 多 ,也 会 造成 同音 词 多 。 


本 文 的 重点 只 是 解释 音 位 结构 负担 的 基本 定义 


和 算法 ， 没 有 涉及 到 汉语 方言 音 位 负担 量 的 细节 内 容 。 实 际 上 ， 一 个 音 位 系统 中 ， 每 个 音 位 


的 总 负担 量 和 平均 负担 量 都 是 不 同 的 ， 基 本 | 


上 体现 为 一 种 近 


以 指数 的 分 布 〈 孔 江平 2013 )。 


因此 ,在 共 时 音 位 系统 和 历时 音 变 中 ,一 个 音 位 的 负担 量 大 可 以 形成 语音 规则 ， 负 担 量 小 则 


不 宜 形成 语音 规则 ， 而 且 很 可 能 容易 丢失 '。 


| 


释 大 量 语言 和 方言 在 共 时 系统 和 历时 演变 的 本 质 。 


1 汉语 方言 负担 量 研究 将 另 文 发 表 。 


a 


在 此 举 一 个 例子 只 是 说 明 音 位 结构 负担 量 能 解 


E ”结束 语 

根据 本 文 提出 的 这 种 首位 负担 的 算法 ,我 们 计算 了 汉 、 藏 、 缅 声韵 调 的 音 位 负担 ， 还 对 
汉语 方言 和 藏 语 方言 进行 了 计算 , 揭示 了 许多 和 以 往 不 同 的 语言 音 位 结构 、 分 布 和 功能 的 规 
律 。 我 们 相信 通过 负担 量 计算 比较 , 可 以 探讨 茶 一 音 位 组 合 或 菜 一 音 位 在 具体 语言 系统 中 的 
地 位 问题 。 对 汉 藏 语系 语言 来 说 ， 就 是 声母 、 韵 母 和 声调 的 组 合 方式 和 他 们 各 自 的 组 合 能 
强 弱 问 题 。 虽然 ,我们 可 以 通过 统计 每 一 个 音 位 出 现 的 次 数 ， 来 看 在 语言 系统 中 具体 音 位 的 
使 用 地 位 ， 但 并 不 能 真正 的 描述 和 解释 每 一 声韵 调 的 音韵 地 位 和 相互 组 合 关 系 。 
总 而 言 之 , 本 研究 一 方面 是 以 单 音节 的 声韵 调 音 位 系统 为 计算 对 象 , 计算 音 位 单元 的 对 
立 频 次 和 负担 量 ， 这 种 方法 如 何 应 用 到 词汇 、 短 语 和 句子 等 层面 的 语言 负担 量 计算 ， 还 需要 
深入 探讨 ， 特 别 是 自然 语 流 中 存在 的 连续 音 变 、 协 同 发 音 、 前 后 音 位 相互 影响 等 特殊 语音 现 
象 。 目 前 对 语言 负担 量 的 贡献 还 无 法 量化 。 另 一 方面 ， 这 种 计算 方法 ， 如 何 进一步 扩展 到 语 
言 类 型 学 、 历 史 语 言 学 、 语 言 习 得 和 语音 识别 中 的 应 用 以 及 语 料 设计 和 后 期 的 语言 模型 优化 
等 方面 ， 还 需 进 一 步 深入 研究 。 
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Abstract 

According to the phoneme theory in the structural linguistics and based on the databases of different 
languages and dialects in China, the phoneme data analysis and series of theoretical studies have been 
done and then the calculating methods on functional load of phoneme structure have been developed. 
The main calculating methods are: 1) the calculating on the frequency of syllable contrast; 2) the cal- 
culating on the contrast type of phoneme load; 3) the calculating on the load of phonemic system; 4) 
the calculating on the average phoneme load. By these methods, the contrast type of phoneme load, 
the load of phonemic system and the average phoneme load of the 3000 single syllable words in 20 
Chinese dialects are calculated and studied. Based on these methods and results, the basic theory of 
phoneme load are proposed and discussed. These methods can be used in the study of phoneme loads 
of different languages, the sound change in historical linguistics, language evolution and the applica- 


tion of speech engineering. 
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